Introdução a Agentes de Resolução de Problemas

Do Reflexo ao Planejamento

Na evolução do design de agentes, passamos de Agentes de Reflexo, que mapeiam percepções diretamente para ações com base em regras simples (por exemplo, “Se o carro à frente frear, inicie a frenagem”), para Agentes de Resolução de Problemas. Agentes de reflexo operam no contexto imediato, enquanto agentes de resolução de problemas são Baseados em objetivos. Eles consideram as consequências futuras de suas ações para encontrar uma sequência que satisfaça um objetivo específico.

Agente de Reflexo: $Action = Função(Percepção)$
Agente de Planejamento: $Sequência\_de\_Ações = Busca(Estado, Objetivo)$

A Representação de Estado Atômico

Neste nível fundamental, os agentes utilizam uma Representação Atômica. Isso significa que o estado do mundo é tratado como uma caixa preta — um nó singular sem estrutura interna visível para o algoritmo de busca. O agente raciocina apenas sobre:

Estados ($S$): Capturas do ambiente.
Ações ($A$): Transições entre estados.
Teste de Objetivo: Uma verificação booleana se o estado $s \in S_{objetivo}$.

O Ciclo de Resolução de Problemas

Um agente de resolução de problemas segue um ciclo distinto de quatro etapas para navegar pelo ambiente:

Formulação do Objetivo: Decidir qual objetivo perseguir com base na situação atual.
Formulação do Problema: Abstraindo o mundo real em um modelo matemático (Estados e Ações).
Busca: Simulando sequências de ações para encontrar o caminho ótimo.
Execução: Executando as ações encontradas durante a fase de busca sem mais deliberações (assumindo um ambiente estático).

Implementação Python (agent_types.py)

class ReflexAgent:
defact( self, percept):
# Mapeamento direto: Regra -> Ação
return regras.get(percept, default_action)
class ProblemSolvingAgent:
def__init__( self):
self.seq = [] # Sequência de ações em buffer
defact( self, percept):
# Se estivermos no meio da execução, continue
ifself.seq:
returnself.seq.pop( 0()
# Caso contrário, Planeje (Busca)
        state = self.update_state(percept)
        goal = self.formulate_goal(state)
        problem = self.formulate_problem(state, goal)
# A busca retorna uma lista de ações
self.seq = search_algorithm(problem)
returnself.seq.pop( 0()